\documentclass[12pt, a4paper]{article}
\usepackage{geometry}
\geometry{
	a4paper,
	left=12.7 mm,
	right=12.7 mm,
	top=12.7 mm,
	bottom=12.7 mm,
}
\usepackage{graphicx}
\usepackage{amsmath}
\usepackage{array}
\usepackage{physics}
\graphicspath{ {./} }
\usepackage{ctex}
\usepackage{tikz}

\newcommand{\bvec}[1]{\ensuremath{\mathbf{#1}}}
\newcommand{\formula}[1]{\text{式} \ref{#1} }

\begin{document}
	\section{4-向量的进一步说明}
	\footnote{参考：Griffiths《电动力学导论》, David Tong 《Dynamics and Relativity》, https://zhuanlan.zhihu.com/p/104923671。本文使用AI辅助。}
	我们已经了解了4-向量，现在我们引入一些正式的学术术语。以下假设$x$是一个4-坐标。
	
	\subsection{4-向量可被Lorentz变换}
	4-向量的第一个要求是，只有能够进行Lorentz变换的量才能被称为4-向量。
	随意构造的4个数并不构成4-向量。
	
	\subsection{协变与逆变向量} 
	4-向量其实有两种形式，协变矢量与逆变矢量：
	\begin{itemize} 
		\item 逆变矢量使用上标$^\mu$表示： 
		\begin{equation} 
			x^{\mu} = (ct, x, y, z)^T 
		\end{equation} 
		其中$^\mu=0,1,2,3$相当于分量的“索引”。
		\item 协变矢量使用下标$_\mu$表示：
		\begin{equation}
			x_{\mu} = (ct, -x, -y, -z)^T
		\end{equation}
	\end{itemize}
	注意逆变和协变向量之间的符号差异。
	在狭义相对论中上下标的位置是有区别的、不能乱写。
	
	\subsection{转换协变与逆变向量；度规}
	简单地说，转换协变与逆变向量时，“对调$\mu=0$时不变号，而对调$\mu=1,2,3$时变号”，
	例如，$x^0 = x_0$，而$x^1 = -x_1$；
	具体地说，逆变和协变向量之间相差一个度规$g$，这相当于一个矩阵乘法： 
	\begin{equation} 
		x_\mu=
		\begin{pmatrix} 
			ct \\ -x \\ -y \\ -z 
		\end{pmatrix} = 
		\begin{pmatrix} 
			1 & 0 & 0 & 0 \\ 
			0 & -1 & 0 & 0 \\ 
			0 & 0 & -1 & 0 \\ 
			0 & 0 & 0 & -1 
		\end{pmatrix} 
		\begin{pmatrix} 
			ct \\ x \\ y \\ z 
		\end{pmatrix} 
		= g x^\nu
	\end{equation}
	此处我们使用“西海岸度规”约定： 
	\begin{equation} 
		g^{\mu\nu} = g_{\mu\nu} = \text{diag}(1, -1, -1, -1) = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix}
	 \end{equation}
	使用更正统的张量语言，我们有
	\begin{equation} 
		x_{\mu} = \sum_\nu g_{\mu\nu} x^{\nu} 
		\qquad 
		x^{\mu} = \sum_\nu g^{\mu\nu} x_{\nu} 
	\end{equation}
	在狭义相对论中，度规的选取并不唯一，不同的文献可能会采用不同类型的度规。
	严格来说，度规反映了时空的结构，但在狭义相对论中，我们只需考虑平直时空，因此问题会简单很多。
	
	\subsection{导数以及张量的协变与逆变}
	我们还会遇到导数的协变与逆变：
	\begin{itemize}
		\item 协变导数$\partial_\mu = \pdv{}{x^\mu} = (\frac{1}{c}\pdv{}{t},\pdv{}{x},\pdv{}{y},\pdv{}{z})^T$，
		\item 逆变导数$\partial^\mu = \pdv{}{x_\mu} = (\frac{1}{c}\pdv{}{t},-\pdv{}{x},-\pdv{}{y},-\pdv{}{z})^T$。
	\end{itemize}
	注意缩写为$\partial$后，上下标刚好和其他4-向量相反！
	此外，当我们使用指标写出$\pdv{}{x^0}$，即对时间维求导时，我们的意思其实是$\frac{1}{c}\pdv{}{t}$。
	
	张量的情况更为复杂，因为它涉及多个索引。
	对调张量的一个上下标时，遵循与向量相同的规则，例如 $F^{10} = F^{1}_{~0} = -F_{10}$。
	从这个例子可以看出，张量可以分为逆变张量、协变张量及其混合形式。
	需要注意的是，张量的索引是有顺序的，因此最好避免写成 $F^{1}_0$，
	因为这样无法明确区分是 $F^{1}_{~0} = F^{10}$ 还是 $F^{~1}_{0} = F^{01}$。
	
	作为初学者，建议将这些规则抄在Lorentz变换的旁边。
	
	\subsection{哑标与自由标；Einstein求和约定}
	在涉及4-向量或张量运算时，我们常常假定Einstein求和约定，
	即当一个指标在同一项中同时出现希腊字母的上标和下标时，
	表示对该指标从0到3进行求和。
	\begin{equation}
		x_\mu x^\mu = \sum_\mu x_\mu x^\mu= \sum_\nu x_\nu x^\nu
		=(ct)^2-x^2-y^2-z^2
	\end{equation}
	这种用于求和的标（这里是$\mu$）也被称为哑标，因为他的含义仅仅是告诉我们做一个求和。
	哑标可以被改名而不影响结果，例如$\mu$可以换为$\nu$而不影响结果等。当然名称不能和现有的其他标重名。
	
	此外，那些不是哑标的标是自由标。自由标一般代表遍历，即分别令$\mu=0,1,2,3$等以构造方程组，例如
	\begin{equation}
		F_{\mu \nu} x^\nu \Rightarrow
		\begin{cases}
			\sum_\nu F_{0 \nu} x^\nu\\
			\sum_\nu F_{1 \nu} x^\nu\\
			\sum_\nu F_{2 \nu} x^\nu\\
			\sum_\nu F_{3 \nu} x^\nu\\
		\end{cases}
	\end{equation}
	总之，自由标不参与Einstein求和。
	
	还有一个惯用约定，希腊字母指标如$\mu, \nu$的范围一般是0到3，并且需要考虑度规，$x_\mu=(ct,-x,-y,-z)^T$；
	而英文字母指标如$i,j$的范围一般是1到3，并且一般不代表4-向量也不需要考虑度规，$x_i=(x,y,z)^T$。
	（不过也不是所有人都遵循这些规则，例如Landau的书也用英文字母代表从0到3的求和）
	
	\subsection{Lorentz变换的形式}
	严格使用协变和逆变的语言，我们先前所述的Lorentz变换可以写为
	\begin{equation}
		x^{(2) \mu} = L^{\mu}_{~\nu} x^{(1) \nu} 
	\end{equation}
	这相当于
	\begin{equation}
		\begin{pmatrix} 
			ct^{(2)} \\ 
			x^{(2)} \\ 
			y^{(2)} \\ 
			z^{(2)} 
		\end{pmatrix} 
		= 
		\begin{pmatrix} 
			\gamma & -\frac{u}{c} \gamma & 0 & 0 \\ 
			-\frac{u}{c} \gamma & \gamma & 0 & 0 \\ 
			0 & 0 & 1 & 0 \\ 
			0 & 0 & 0 & 1 
		\end{pmatrix} 
		\begin{pmatrix} 
			ct^{(1)} \\ 
			x^{(1)} \\ 
			y^{(1)} \\ 
			z^{(1)} 
		\end{pmatrix}
	\end{equation}
	因此，Lorentz矩阵是一个混变的矩阵。
	
	\subsection{4-向量的内积}
	在狭义相对论中，当我们说“4-向量的内积”时，我们一般指的是协变矢量和逆变矢量的乘积，例如：
	\begin{equation}
		X = x_\mu x^\mu =(ct,-x,-y,-z)\cdot(ct,x,y,z)^T =  (ct)^2-x^2-y^2-z^2
	\end{equation}
	要非常留意负号上的区别！
	
	\newpage
	\section{Lorentz 不变量}
	\subsection{Lorentz 不变量}
	
	Lorentz不变量是指“在Lorentz变换下保持数值不变的物理量”。
	换句话说，不同参考系下的观测者会观察到该物理量具有相同的数值。
	再次强调，这里不能望文生义：“Lorentz 不变”是指该物理量在不同参考系中的数值相同，而不是指该物理量不随时间变化。
	
	例如，粒子的质量
	\footnote
	{
		在早期文献中，包括爱因斯坦著名的相对论开山之作《论动体的电动力学》中，质量有时被视为变量。
		这是因为在解释相对论动量 \(\bvec{p} = \gamma m_0 \bvec{v}\) 时，
		有人将 \( m_{\text{rel}} = m_0 \gamma \) 视为一个整体“相对论质量”，并保持动量的形式不变 \(\bvec{p} = m_{\text{rel}} \bvec{v}\)。
		在这种解释下，“相对论质量”并不是不变的。
		据我所知，如今更多人认同相对论修正了动量的形式为 \(\bvec{p} = \gamma m_0 \bvec{v}\)，从而使静止质量 \( m_0 \) 成为了Lorentz不变量。
	}
	\( m_0 \) 和电荷 \( q \) 是典型的Lorentz不变量，在不同参考系下观测到的值是相同的。
	
	
	\subsection{4-向量的“模长”是Lorentz不变量}
	Lorentz变换有一个很重要的性质：
	如果在$S1$系下看到某一个4-向量的内积是
	\begin{equation}
		X^{(1)} = \sum_\mu x^{(1)}_\mu x^{\mu(1)}
	\end{equation}
	在$S2$是
	\begin{equation}
		X^{(2)} = \sum_\mu x^{(2)}_\mu x^{\mu(2)}
	\end{equation}
	那么这二者应该是相同的。
	\begin{equation}
		X^{(1)} = X^{(2)}
	\end{equation}
	也就是说，4-向量的“模长”是Lorentz不变量，其大小无关参考系选取。
	不同参考系中的人可能看到4-向量不一样的分量，但一旦计算内积，大家都会得到相同的答案。
	
	在这个证明中，使用指标语言证明有点太冗长了，因此我们转而使用矩阵乘法的语言。
	我们发现
	\begin{equation}
		X^{(2)} = (gx^{(2)})^T x^{(2)} = 
		(g (L x^{(1)}))^T (L x^{(1)})
		= x^{(1)T} L^T g^T L x^{(1)}
	\end{equation}
	即只需证明
	\begin{equation}
		L^T g^T L = g
	\end{equation}
	这个证明其实很容易完成，只需代入相应度规和Lorentz的形式并计算就能得到结果。
	有时这个结果被反过来当作Lorentz变换矩阵的定义，即只有那些能保证4-向量“模长”不变的变换才是Lorentz变换。
	
	\subsection{举个例子}
	“4-位移”的“模长”平方是
	\begin{equation}
		(\dd s)^2 = \dd x_\mu \dd x^\mu = (c \dd t)^2 - (\dd x)^2 - (\dd y)^2 - (\dd z)^2
	\end{equation}
	而$S0$固连参考系中，“4-位移”的“模长”平方是（固连系中粒子不运动）：
	\begin{equation}
		(\dd s)^2 = (c t^{(0)})^2
	\end{equation}
	重点来了！正如我们上文所述，$\dd s^2$ 在所有参考系中都保持相同的“人设”（是Lorentz不变量），不同参考系的观察者可能会看到粒子以不同的速度奔跑，但大家都会一致认同“时空路程”$\dd s^2$ 的值。
	这就启发我们，$\dd s^2$ 和固有时 $t^{(0)}$ 其实是“孪生兄弟”，唯一的区别是前者多乘了个光速 $c$ 的平方。
	相对论中“4-位移”的“模长”可比非相对论物理里的“路程”强多了——后者在不同参考系中简直是“人设崩塌”，参考系一变，数值就变。
	
	4-速度的“模长”平方是
	\begin{equation}
		U_\mu U^\mu = \gamma^2 ((c)^2 - (v_x)^2 - (v_y)^2 - (v_z)^2) = \gamma^2 (c^2-v^2) = c^2
	\end{equation}
	这又是一个惊人的发现！无论粒子怎么折腾，加速、减速、甚至跳个太空舞，粒子4-速度的“大小”永远是光速 $c$。
	这也是坊间俗语“粒子速度总是光速，只是偶尔在时间轴上跑得快，偶尔在空间轴上跑得快”的来源
	（4-速度限定！“平常”速度没有这么好的性质）。
	
	使用4-速度的语言，我们能更好理解为什么$\dd s^2$是无关参考系的：
	\begin{equation}
		\dd s^2
		= \dd x_\mu \dd x^\mu
		= U_\mu U^\mu (\dd t^{(0)})^2
		= c^2 (\dd t^{(0)})^2
		\qquad \dd x^\mu = U^\mu \dd t^{(0)}
	\end{equation}

	4-动量的“模长”平方是
	\begin{equation}
		P_\mu P^\mu = m_0^2 c^2
	\end{equation}
	只和粒子的静止质量有关。
	
\end{document}